#coding:utf-8

"""@author WTBF"""

from urllib import request

# html 内容下载器
# 过程：
# 从待爬去的url管理中取出一个url，下载器会将url指定的网页下载下来，存储成一个字符串。 
# 用到了python的urllib2库，实现网页的下载。

class HtmlDownloader(object):

    """html 内容下载器"""

    def download(self, url):
        # 如果传进来的url为None,就直接退出
        if url is None:
            return

        # 直接请求url
        response = request.urlopen(url)

        # 获取请求结果，如果返回结果不是200（成功），就直接退出
        if response.getcode() != 200:
            return None
        # 如果请求成功就返回下载后得到的内容
        else:
            return response.read()

        